iT邦幫忙

2021 iThome 鐵人賽

DAY 15
0
AI & Data

30Day 從一介凡人羽化成資料科學初學者系列 第 15

Day15-seaborn(3)盒鬚圖boxplot、熱力圖heatmap

  • 分享至 

  • xImage
  •  

盒鬍圖
可用來觀察資料的分布情形
最大值、最小值、中位數、四分位數
一樣使用Titanic資料集做示範

使用seaborn的boxplot繪製長條圖
長方形最上面那條線為第三四分位數,資料從小到大的第75%資料
長方形中間那條線為第二四分位數,資料從小到大的第50%資料,也就是中位數
長方形最下面那條線為第一四分位數,料從小到大的第25%資料
最上面以及最下面分別為最大值、最小值,其他點則為離群值
https://ithelp.ithome.com.tw/upload/images/20210829/20140416LxrzhUa45U.png

熱力圖
可用來觀察數值間的係數關係
通常會配合pandas的corr方法使用
corr會算出各值之間的係數關係,會自動過濾掉遺失值或不是數字型態的值
會介於-1~1之間,越靠近1就表示愈成正比,越靠近-1就表示愈成反比,越靠近0表示愈沒有關係
https://ithelp.ithome.com.tw/upload/images/20210829/20140416DwfqeUf7N3.png

使用seaborn的heatmap繪製熱力圖
https://ithelp.ithome.com.tw/upload/images/20210829/201404165zmuA5HdRm.png

可將參數annot設位Ture,可直接觀察數字
https://ithelp.ithome.com.tw/upload/images/20210829/20140416rkseR6Fi9x.png

使用seaborn的pairplot可直接觀察各數值之間的關係

sns.pairplot(data_set,hue='Survived')

我將Survived放入hue做分類來觀察
https://ithelp.ithome.com.tw/upload/images/20210829/20140416nnomnJNFpi.png

送上colab連結,可自行在上面多做點練習更加熟悉seaborn
https://colab.research.google.com/drive/1cEqnvujTRBvO7AvljWl021mgs7zL8yMv?usp=sharing
Titanic資料下載
https://www.kaggle.com/c/titanic/overview


上一篇
Day14-seaborn(2)直方圖histplot、散佈圖jointplot
下一篇
Day16-sklearn(1)正規化StandardScaler、MinMaxScaler、MaxAbsScaler
系列文
30Day 從一介凡人羽化成資料科學初學者30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言